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摘要 : 细胞 色素 P450 在 各 种 内 源 和 外 源 物质 代谢 中 起 着 非常 重要 的 作用 。 利 用 驴 豆 蚜 Acyrthosiphon pisum 基因 组 
mRNA 和 氨基 酸 数 据 库 研 究 PASO 基因 功能 的 进化 规律 。 通 过 生物 信息 学 方法 对 吏 豆 是 全 基因 组 P450 进行 分 析 , 结 
Ab: 在 苦 豆 虹 基 因 组 中 发 现 69 个 P450 ÆN, 它们 分 别 属于 13 个 P450 家 族 和 18 个 亚 家 族 , 是 一 个 典型 的 多 基 
因 家 族 。 进 一 步 将 这 些 基 因 与 豌豆 是 ESTs 数据 库 进 行 了 比 对 分 析 , 其 中 39 个 候选 基因 有 EST 证 据 , 证 明了 这 些 
P450 基因 在 转录 水 平 的 真实 性 。 以 氨基 酸 相 似 度 大 于 60% 为 标准 对 豌豆 是 基因 组 中 P450 基因 进行 分 组 , 69 个 
P450 基因 中 , 除 18 个 基因 序列 因 差 异 太 大 , 不 能 被 归 人 任何 一 组 ,其 余 51 个 可 归 入 10 个 组 , 其 中 8 个 组 (包含 47 
条 序列 ) 适合 于 正 选 择 和 基因 转换 分 析 。 正 选择 和 基因 转换 分 析 结 果 表 明 : UR 1 个 组 ( 售 9 个 基因 ) 显 著 受 到 正 选 
择 压 力作 用 , 正 选择 概率 大 于 95% 的 氨基 酸 位 点 分 别 是 20T 和 27N, 20T 位 于 底 物 识别 位 点 SRS1, 27N 位 于 D-helix; 
有 3 个 组 (包含 8 个 基因 ) 显示 显著 的 基因 转换 事件 。 参 与 基因 转换 的 基因 均 为 CYP4 家 族 成 员 , 分 别 是 CYPAC, 
CYP4G 和 CYPAV 亚 家 族 。 参与 基因 转换 的 成 员 之 间 的 蛋白 相似 度 较 高 (70%~95% ) ， 且 XM_001944991 与 XM_ 
001951794 同 存在 于 SCAFFOLD12542 E, XM. 001945510 5 XM. 001944057 同 存在 于 SCAFFOLD7010 上 。 这 可 能 暗 
ZEE PUE PASO 基因 通过 基因 复制 ,然后 通过 基因 转换 使 P450 获得 新 的 功能 ,以 适应 多 变 的 生存 环境 。 此 外 , 鉴定 
出 20 个 不 同 的 基 序 , 其 中 有 5 条 基 序 在 9096 以 上 的 基因 中 出 现 。 
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中 图 分 类 号 : 0966 ”文献 标识 码 : A ”文章 编号 : 0454-6296(2010)08-0849-08 
A genome-wide analysis of P450 gene families in the pea aphid, 
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Abstract: Cytochrome P450 plays a dominant role in the metabolism of a wide variety of both endogenous 
and xenobiotic substances. The evolution of P450 gene function was analyzed in the genome of the pea 
aphid, Acyrthosiphon pisum , using the mRNA and amino acid data. A genome-wide analysis of P450 genes 
was performed in pea aphid genome by bioinformatical methods. The results showed that sixty-nine P450 
genes were discovered in pea aphid genome, which are of a typical superfamily and belong to 13 families 
and 18 subfamilies. We collected expression sequence tag ( EST) evidence for 39 putative P450s genes, 
which are expressed at the transcriptional level and more likely to be true P450s. Because of significant 
differences in gene sequences, among 69 P450 genes 18 genes could not partitioned into any group, while 
the rest 51 P450 genes were partitioned into 10 groups by a criterion that the genes belong to a group when 
their amino acid identity is more than 60%. Positive selection and gene conversion were analyzed in 8 
groups (including 47 genes). Positive selection was detected in only one group ( including 9 genes). The 
positively selected sites with a more than 95% probability were 20T and 27N, located in substrate 
recognition site ( SRS1) and D-helix, respectively. The significant gene conversion events were detected in 
3 groups (8 sequences). P450 genes that identified gene conversion events were members of CYP4 family, 
which were CYPAC, CYP4G and CYPAV subfamily, respectively. Protein similarity between P450 genes 
with gene conversion was 7096 —9596. P450 genes with gene conversion lay in the same scaffold, e. g., M 
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.001944991 and XM, 001951794 lay in SCAFFOLD12542, while XM, 001945510 and XM, 001944057 lay 
in SCAFFOLD7010. The results suggest that P450 genes may gain new function through gene duplication 


and gene conversion. Moreover, twenty motifs were identified, of which 5 motifs existed in over 90% of 


P450 genes. 
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1955 ^E Hayaishi 和 Mason 同时 首次 发 现 细胞 
色素 P450, 由 于 其 在 450 nm 处 有 一 个 特征 性 的 吸 
收 峰 , 将 其 命名 为 P450, 1967 年 Ray 首次 在 家 晶 
中 确定 了 细胞 色素 PASO 的 人 存在。 随后 Snyder 和 
Davidson( 1983 ) 分 离 出 了 昆虫 第 一 个 细胞 色素 P450 
的 cDNA, P450 功能 具有 多 样 性 ， 这 主要 是 由 于 
P450 种 类 的 多 样 性 以 及 广泛 的 底 物 特异 性 。 目 前 
研究 表明 昆虫 P450 的 功能 主要 有 两 大 类 : 一 是 众 
化 内 源 性 物质 (如 省 醇 脂 肪 酸 及 信息 激素 等 ) 的 生 
物 合成 和 降解 ,维持 生物 体 的 正常 功能 ; 二 是 针对 
外 源 性 物质 ( 如 杀 虫 剂 、 植 物 次 生物 质 等 ) 的 解毒 与 
活化 的 作用 (杨帆 和 王 进 军 , 2008 ) 。 其 中 细胞 色素 
P450 对 杀 虫 剂 的 代谢 作用 增强 是 大 多 数 昆 虫 产 生 
抗 药 性 的 主要 机 制 。 关 于 细胞 色素 P450 与 杀 虫 剂 
抗 性 的 关系 ,最早 来 自 于 对 P450 抑制 剂 sesamax 能 
够 逆转 昆虫 对 西 维 因 抗 性 的 观察 。 目 前 由 于 人 们 大 
量 施 用 化 学 杀 虫 剂 , 造成 昆虫 抗 药 性 的 增强 ， 至 今 
已 发 现 有 500 多 种 昆虫 对 不 同类 型 的 杀 虫 剂 产 生 了 
抗 药性 (Scott et al., 1998) 。 这 种 抗 性 的 产生 涉及 
不 同 的 机 制 , 但 其 中 较为 重要 的 是 由 P450 酶 活性 
增强 引起 的 昆虫 抗 药 性 (Scott et al., 1998). 。 细 胞 
色素 P450 参与 的 杀 虫 剂 抗 药 性 主要 是 由 于 通过 转 
录 水 平 、 基 因 水 平和 翻译 水 平等 方面 实现 解毒 作用 
的 增强 。 迄 今 为 止 , 国内 外 已 克隆 和 鉴定 的 昆虫 
P450 基因 集中 在 8 目 40 多 种 昆虫 , 分 属 多 个 家 族 
和 亚 家 族 ( 杨 帆 和 王 进 军 , 2008; RFE, 2009), 
如 Li 等 (2005) 对 家 看 的 全 基因 组 P450 进行 初步 鉴 
E, 将 其 归 入 17 个 家 族 和 32 个 亚 家 族 。 

B EZ Acyrthosiphon pisum (2EXB E : SERE) 是 
一 种 重要 的 农业 害虫 , 在 农作物 生长 季 市 其 种 群 迅 
速 增长 (Lane and Walters, 1991) , Wi TIFE Œ 
长 的 影响 主要 表现 在 取 食 植物 的 汁液 和 传播 植物 病 
毒 。 豌 豆 虹 是 研究 昆虫 适应 分 子 遗 传 机 制 较 好 的 材 
料 。 吏 豆 蚜 相关 基因 组 序列 的 公布 , 为 了 解 蚜 虫 生 
物 学 和 应 用 研究 提供 了 条 件 。 本 文通 过 对 吏 豆 蚜 全 
基因 组 P450 基因 种 类 的 鉴定 、 正 选择 方式 和 基因 间 
序列 重组 和 交换 的 评估 来 研究 PASO 基因 家 族 的 进 


化 规律 ,为 进一步 研究 PASO 基因 家 族 与 昆虫 抗 药 
性 的 产生 之 间 的 关系 提供 参考 依据 。 


1 材料 与 方法 


1.1 吏 豆 蚜 全 基因 组 P450 基因 的 鉴定 

以 更 豆 蚜 为 研究 对 象 ， 基因 组 序列 与 mRNA 和 
和 蛋白 序列 来 自 于 Acyrthosiphon pisum genome 数据 库 
(ftp://ftp. ncbi. nih. gov/genomes/ Acyrthosiphon _pisum/ 
special. requests) 。 利 用 上 述 数 据 建立 本 地 mRNA 
和 和 蛋白 序列 数据 库 。 豌 豆 蚜 全 基因 组 中 PASO 首先 
用 P450 的 HMM( Hidden Markov Model) 序列 在 本 地 
Wt; Sf mRNA 数据 库 中 进行 ThblastN ( E. value 
threshold » 0.01) 搜索 , 得 到 所 有 可 能 是 P450 类 型 
基因 的 序列 ; 再 到 相应 所 重 日 数据 库 寻 找 相 对 应 的 
氨基 酸 序 列 , 然后 将 这 些 基因 序列 对 应 的 氨基 酸 序 
列 分 别 通 过 Pfam ( http://pfam. wustl. edu/ 
hmmsearch. shtml ) 程序 检验 其 是 否 含 有 P450 结构 
域 。 对 所 获得 的 P450 基因 在 http://132. 192. 64. 
52/p450. html/rB, E-value < le ' 的 情况 下 作 
BLASTP 比 对 ， 进 行 基因 家 族 和 亚 家 族 的 命名 
( Altschul et al., 1997) 。 
1.2 P450 EST 的 比 对 

K T uESCX Ee BU BT P450s 基因 的 真实 
性 , 进一步 寻找 了 其 表达 序列 标签 ( expressed 
sequence tag, EST) 证 据 。ESTs 数据 源 于 GenBank, 
进行 较 严 格 的 BLASTN HEX} (E-valuezle P), 
1.3 P450 基因 的 分 组 

利用 ClustalW ( http://www. ebi. ac. uk/clustalw/ ) 
进行 基于 氮 基 酸 的 基因 编码 区 的 核 苷 酸 序列 排序 。 
根据 排序 结果 ， 利 用 MEGA 4.0 (http://www. 
megasoftware. net/) 对 所 有 序列 进行 距离 法 
( Neighbor-Joining method ) 系统 树 的 构建 。 对 系统 树 
进化 校 中 的 基因 根据 氨基 酸 相 似 度 大 于 60% 的 标 
准 分 组 。 
1.4 P450 基因 正 选 择 和 基因 转换 分 析 

使 用 PAML ( Yang et al., 2000) 软件 包 中 的 
codeml 程序 , 分 别 在 不 同 的 密码 子 蔡 代 模型 M7 和 
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M8 下 进行 计算 ,这 两 种 模型 的 适合 度 通 过 似 然 比 
( likelihood ratio, LR) 统计 方法 来 检验 ， 对 P450 基 
8 个 组 中 的 47 条 基因 进行 正 选 择 位 点 的 分 析 ， 
同时 满足 下 列 两 个 条 件 即 判断 为 显著 的 正 选择 : 
(1) 对 于 M7-M8 的 LR 检验 , 其 结果 2Al 的 显著 程 
度 根据 其 相对 于 XxX2(d.f =1) 的 分 布 值 进行 判断 ， 
即 当 2Al>3.84 Hf, P «0.05, 显示 为 显著 ; 2Al > 
10.83 Hf, P<0.001, 显示 为 极 显 车; (2) M8 计算 
结果 中 w > 1.0。 正 选择 的 氨基 酸 位 点 通过 PAML 
中 的 Bayesian 方法 计算 得 到 。 利 用 ClustalW 把 具有 
正 选择 组 的 P450 蛋白 序列 与 已 知 其 晶体 结构 的 细 
Wi P450cam( CYP101 ) 和 蛋 日 序列 进行 匹配 ,以 确定 
正 选择 位 点 的 所 在 区 域 。 组 内 基因 间 的 序列 交换 检 
验 采 用 GENECONVI. 81 程序 默认 参数 来 完成 
( http ://www. math. wustl. edu/ ~ sawyer/geneconv/ ) 。 
P «0.05 为 具有 统计 意义 的 基因 交换 事件 。 
1.5 P450 蛋白 的 基 序 分 析 

运用 MEME 程序 (http ;//meme. sdsc. edu/meme/ 
meme. html) 分 析 所 有 P450 蛋白 结构 域 的 基 序 , 参 
数 设置 如 下 : 基 序 数目 限制 在 20 以 下 ,长 度 限制 在 
6 ~200 个 氨基 酸 残 基 。 


2 结果 与 分 析 


2.1 WE P450 基因 的 种 类 

豌豆 蚜 10 467 个 基因 ,其 中 P450 基因 有 69 
个 , 占 整 个 基因 组 的 0. 66%。 存 在 于 32 个 
SCAFFOLD E, 在 每 个 SCAFFOLD 上 存在 1~4 个 
P450 基因 。 其 中 在 SCAFFOLD10025 上 含有 4 个 
CYP6 家 族 的 P450 基因 ，SCAFFOLD10061 含有 3 
个 CYPAG 亚 家 族 的 P450 基因 ，SCAFFOLD7010 含 
有 4 个 CYP4V 亚 家 族 的 P450 基因 。 根 据 它们 的 氨 
基 酸 序列 相似 程度 划分 而 归属 于 13 个 基因 家 族 和 
18 个 亚 家 族 ( 表 1), 其 中 有 9 个 多 基因 家 族 ; 2 个 
基因 家 族 的 成 员 超过 20 个 ，CPY4 有 26 个 成 员 ， 
CYP6 有 23 个 成 员 , 占 豌 豆 蚜 PASO 基因 的 71%。 
2.2 WEIJ P450 的 EST 分 布 

目前 在 GenBank rp && Bü xi |p EST 数量 约 为 
94 000 Z& , 这 些 EST 序列 来 自 于 蚜虫 的 头 部 \ 符 虫 、 
BELLA AG SRZHZH S Wi P450 基因 的 EST 数量 
BUS 143 Z&, 23, Sr TA EST 的 0. 1596, TE 
69 个 豌豆 蚜 P450 基因 中 有 39 个 在 GenBank 中 发 
现 1 条 以 上 的 IST 序列 ，P450 基因 最 多 含有 29 条 
EST 序列 (图 1)。 另 外 有 30 个 P450 基因 未 发 现 


EST 序列 存在 , 这 可 能 是 这 些 基 因 在 豌豆 蚜 不 能 高 
表达 或 者 是 在 发 育 的 某 个 阶段 特异 表达 。 
表 1 WEI P450 基因 家 族 和 亚 家 族 统计 
Table1 Statistics of P450 families and subfamilies in the 
pea aphid, Acyrthosiphon pisum 


家 族 可 能 的 P450 数目 ER 可 能 的 P450 数目 

Family Number of P450 Subfamily Number of P450 

CYPI15 3 CYP15A 1 
CYP1SB 2 

CYP18 1 CYP18A 1 

CYP6 23 CYP6Y 3 
CYP6A 9 
CYP6M 11 

CYP4 20 CYP4C 14 
CYP4C 8 
CYP4V 4 

CYP49 2 CYP49A 2 

CYP315 1 CYP315A 1 

CYP314 3 CYP314A 3 

CYP307 3 CYP307A 3 

CYP306 1 CYP306A 1 

CYP305 2 CYP305A 2 

CY P303 2 CYP303A 2 

CYP302 1 CYP302A 1 

CYP301 1 CYP301A 1 


35 


30 


25 上 


20 | 


P450 基 因数 量 
Number of P450 genes 


0.1 23 4 5 67 8 9 10 11 12 1314 24 29 
ESTs2 5 Number of ESTs 


图 1 豌豆 蚜 P450 基因 在 GenBank 中 的 EST 数量 分 布 
Fig.1 Distribution of numbers of ESTs available in GenBank 
for P450 genes in Acyrthosiphon pisum 


2.3 WE P450 基因 的 分 组 

根据 豌豆 蚜 基 因 组 69 个 P450 基因 编码 区 的 核 
芽 酸 序列 排序 ,， 并 利用 MEGA 4.0， 按 距离 法 
( Neighbor-Joining method ) 对 所 有 序列 构建 了 系统 树 
(图 2), 反映 了 69 个 P450 基因 之 间 的 进化 关系 。 
由 于 豌豆 蚜 P450 基因 序列 差异 较 大 ,， 有些 相 似 度 
仅 有 10% 左 右 。 为 更 好 地 分 析 基 因 正 选择 和 基因 
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转换 , qe MRZSEAXLEIPASO 基因 亲缘 关系 的 拓扑 
结构 (图 2), 对 其 进行 了 分 组 , 分 组 标准 为 系统 树 
进化 校 中 基因 的 氨基 酸 相 似 度 大 于 60% 。 结 有 果 显 
示 : WEE 69 个 P450 基因 中 的 51 条 序列 可 归 入 
10 个 组 , 而 其 余 的 18 条 基因 序列 因 差 异 太 大 而 不 
能 被 归 人 任何 一 组 。 

在 上 述 10 个 组 的 51 条 序列 中 , 最 大 的 组 包含 
12 条 序列 , 最 小 的 组 仅 包 含 2 条 序列 , 每 组 平均 5. 1 
条 。 在 这 10 组 中 , 有 2 组 仪 包 含 2 条 序列 , 由 于 正 
选择 位 点 的 PAML 分 析 以 及 基因 转换 的 GENECONV 
要 求 最少 有 3 条 序列 , 因此 , 最 终 用 于 正 选 择 和 基因 
转换 分 析 的 序列 共 8 组 , 包含 47 条 序列 。 

2.4 WZ P450 正 选择 .基因 转换 以 及 二 者 相互 
关系 

对 P450 基因 8 个 组 中 的 47 条 基因 进行 正 选择 
位 点 的 分 析 , 结果 显示 : 仪 有 1 个 组 , 包含 9 条 基 
因 , 符合 显著 正 选择 的 条 件 , 说 明 这 些 基因 可 能 受 
到 正 选择 压力 作用 ( 表 2) 。 在 该 组 中 , 利用 MS 中 
Bayesian 方法 检验 出 2 个 概率 大 于 95% 的 正 选 择 氨 
基 酸 位 点 , 分 别 是 20T 和 27N。 与 细菌 的 P450cam 
进行 序列 比 对 发 现 , 20T 位 于 底 物 识别 位 点 SRS1， 
27N 位 于 D-helix, 该 区 域 具 有 底 物 区 域 选 择 性 功能 
( regioselectivity ) ( Lewis et al., 1999) , 

AE DER Be f 2 A I] Je d DAT RI P^ HE CERERI RP 
差异 , 因而 对 基因 家 族 的 进化 起 着 十 分 重要 的 作用 
( Rewitz et al., 2006) 。 我 们 对 P450 基因 的 基因 转 
换 进行 了 分 析 。 数 据 分 析 表 明 , 在 47 条 PASO 基因 
构成 的 8 个 组 中 , 有 3 个 组 (包含 8 基因 , 占 人 研究 基 
因 组 的 11.696 ) 检 测 出 了 统计 上 具有 显著 意义 的 基 
因 转 换 事 件 ( 表 3)。 在 这 3 个 组 中 , 转换 事件 的 次 
数 为 3 到 7 次 , 基因 转换 的 长 度 从 19 ~ 90 bp 不 等 。 
与 此 同时 发 现 参与 基因 转换 的 基因 均 为 CYP4 家 族 
成 员 ,， 分 别 是 CYPAC, CYPAG 和 CYPAV 亚 家 族 。 
参与 基因 和 转换 的 成 员 之 间 的 蛋白 相似 度 在 70% ~ 
95% 之 间 , 且 XM_001944991 5j XM. 001951794 [n] 
存在 于 SCAFFOLD12542 E, XM. 001945510 与 XM 
_001944057 同 存 在 于 SCAFFOLD7010 上 。 

在 P450 基因 8 个 组 中 , 检测 出 显著 正 选 择 位 
点 的 基因 共 9 个 , 占 人 研究 基因 的 19.196 ; 检测 出 参 
与 基因 转换 的 基因 8 个 ( 占 人 研究 基因 的 17. 0% ); 
没有 检测 到 既 为 正 选择 位 点 ， 又 参与 基因 交换 的 基 
E]; 既 没 有 检测 出 正 选 择 位 点 ， 又 没有 检测 出 基因 
转换 的 基因 30 个 , 占 63.8% (图 3)。 
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A2 似 然 比 检验 结果 
Table 2 Likelihood ratio test results 


组 号 基因 数 2Al M8 计算 结果 

Group no. Gene number M8 estimates 

1 12 0 w 9.34143, p 20. 00000 
2 4 0.52 «€ 21.00000, p =0. 04146 
3 4 2.8 «€ 210.0303, p =0. 00892 
4 3 0 «€ = 1.00000, p 20. 02997 
5 9 8.78 € =2. 32979, p =0. 02426 
6 9 0 «€ = 1.00000, p =0. 00718 
7 3 0 «€ 21.00000, p =0. 11436 
8 3 3.24 «€ 2.66780, p =0. 02340 


正 选择 的 氨基 酸 位 点 


Positively selected positions 


98S 249 Y 

1Y 

250V 504R 505P 

20T 27N 121P 

15L 

3Q 12G 18V 37S 39V 64V 152V 160A 161M 172S 174R 185Q 200G 
210Y 228F 300C 302D 304R 373A 383R 392L 393K 449L 

69G 113E 316T 318I 


N 表示 组 内 的 序列 数目 ; 2A 是 LR 检验 的 结果 ; o 是 利用 M8 计算 所 得 的 DNADS 值 , p 值 是 M8 计算 得 到 的 正 选 择 位 点 占 所 检测 位 点 的 百 分 
数 ; M8 结果 以 黑体 标 出 的 是 正 选择 的 组 ; 表 中 列 出 的 氨基 酸 是 后 验 概率 大 于 0.5 的 位 点 , 其 中 黑体 列 出 的 氨基 酸 是 后 验 概 率 大 于 0. 95 的 位 


HON 


INO 





represents the sequence number within a group; 2Al represents the test results of likelihood ratio; œ is DN/DS estimated under M8; p value is the 


inferred proportion of positively selected sites; « and p values in bold represent significant tests for positive selection under M8. The amino acids listed in 


positively selected positions had a posterior probability » 0.5, and those in bold listed in positively selected positions had a posterior probability » 0. 95. 
RI P450 基因 的 正 选择 和 基因 转换 的 分 析 


Table 3 P450 gene sequence analyzed for positive selection and gene conversion 


基因 交换 Gene conversion 


组 号 I K E RECb 
edo qo HAMA DET: 片段 长 度 (bp) ”基因 数目 
Event Fragment length Gene number 
XM 001944991 XM 001951794 XM, 001944396 
1 XM, 001944452 XM. 001951556 XM, 001944495 1635 3 19 3 
XM 001948854 XM. 001952404 XM. 001950999 
XM, 001945326 XM, 001947733 XM, 001952149 
XM 001947219 XM 001948106 XM, 001948952 
2 XM. 001948871 1 554 3 20 2 
XM 001943388 XM. 001949505 XM. 001952075 
3 XM 001950191 1 620 0 0 0 
4 XM, 001945510 XM. 001944057 XM. 001944008 ] 533 7 23 3 
XM 001948546 XM. 001948408 XM. 001952692 
5 XM 001943535 XM. 001943595 XM. 001948453 ] 833 0 0 0 
XM 001946349 XM. 001951431 XM, 001948658 
XM 001952415 XM. 001948520 XM. 001948899 
6 XM 001943946 XM. 001947885 XM. 001943115 1 845 0 0 0 
XM 001948386 XM. 001945798 XM. 001951870 
7 XM 001948572 XM, 001948633 XM. 001942470 1 566 0 
8 XM 001949467 XM. 001945899 XM. 001952585 1 728 0 0 





黑体 序号 代表 处 于 正 选 择 压力 的 组 ; 黑体 基因 序列 名 称 代 表 参 与 基因 转换 的 基因 。Group number in bold represents the positive selection group; 


sequence name in bold represents the genes which had undergone gene conversion events. 


35 


基因 数 Number of genes 
四 





PS GC PS+GC NONE 


图 3 下 选择 基因 、 基 因 转 换 基因 的 总 的 分 布 


Fig.3 Distribution of number of the genes under positive 


selection or gene conversion 


PS: 正 选 择 Positive selection; GC; 基因 转换 Gene conversion; PS + GC; 
正 选 择 和 基因 转换 Both positive selection and gene conversion; NONE; BE 
非 正 选择 又 非 薪 因 转 换 Neither positive selection nor gene conversion. 


2.5 WEI P450 蛋白 的 基 序 分 析 

Ji xig PASO 基因 编码 和 蛋 日 氨基 酸 平 均 数 目 为 
462.7, 其 中 最 小 的 P450 和 蛋白 含有 147 个 氨基 酸 
( XM, 001952686) , 最 大 的 P450 和 蛋白 含有 642 TA, 
基 酸 (XM_001946349) 。 通 过 MEME 程序 对 纹 豆 蚜 
P450 蛋 日 序列 进行 分 析 ， 鉴 定 出 20 个 不 同 的 motif 
( 表 4), 其 中 有 5 条 motif Æ 90% 以 上 的 基因 中 出 
M, 它们 的 情况 分 别 是 motif 2 为 Hilex-I 基 序 , motif 
4 为 EXXR 3E Jf, motif 1 为 Heme-binding 3 Jy, 
motif 11 为 PKG 基 序 ， 而 motif 3 为 PERF 基 序 
(Rewitz et al., 2006) 。 
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表 4 P450 蛋白 的 基 序 分 析 
Table 4 Analysis of motifs in P450 proteins 


基 序 编号 频率 基 序 长 度 (aa) 
Motif no. Frequency Motif length 
1 0.985 21 
2 0. 942 29 
3 1 21 
4 0.913 29 
5 0. 739 29 
6 0. 304 50 
7 0. 681 29 
8 0. 300 49 
9 0. 348 37 
10 0. 333 41 
11 0. 900 15 
12 0. 73 21 
13 0. 174 41 
14 0.493 21 
15 0. 333 29 
16 0. 304 29 
17 0.319 30 
18 0. 304 23 
19 0. 362 11 
20 0. 348 21 


氨基 酸 序列 


Amino acid sequences 


MPFGDGPRMCIGQRYAMMEMK 
GHETTSSTLCWCLYMLAHHQDIQDKVRDE 
HHDPKYWPNPEKFDPERFSPE 
HDGQITNEDLMDMHYLEMVIKETLRMYPP 
LGNGLFTMEGQKWHTHRQKLTPAFHSGKL 
YHKIYHQFPGHKYCGFYQMRTPYLMVRDPELINNVLIKDFSYFTDHGIYM 
FDVWDYMAKYSTDVICQCAMGYNLNAQNN 
VKDFPTDATDFFHAAFQETITYREENNIVRNDFVQCLMQARNDLVLNED 
PCTIIVTIAYYYCTSTYKKWEKLNVPYIKPIPLFGNF 
LALSEILTKFEVFPCEKTEIPLKYSNGSGVLMPKHGIWLRF 
SQDYHIPKGTTCIES 

ENGHNFSDEDIRDEV VTMMAA 
FLRHYSVHTDCKLTDIKLKLDLLMRSANGYPVTIRPRDRRP 
QINECNDELMRNIDKQLNKTQ 
MWCYFKWHNRHFEKLA ARMPGPPA YPIIG 
YFYVVITDPEDIQIVLNSSQALQKGQEYD 
CEYVEAMQKACHIWQMRIYHPWLWPDIVFQ 
ESEFRKYGKAIFQPSLRQLFREM 

GQKIIIPMYSI 

DVTNNEEHQSKVFLDTLFELN 


黑体 示 9096 以 上 频率 出 现 的 基 序 。Meotifs with a frequency >90% are in bold. 


3 讨论 


通过 对 更 豆 蚜 基因 组 数据 库 分 析 , 我 们 发 现 有 
69 个 细胞 色素 P450 基因 ,， 少 于 黑 腹 有 果 蝇 Drosophila 
melanogaster ( 86 个 P450) Il [x] EE, NV. TE t. Anopheles 
gambiae( 105 个 P450) (Strode et al., 2008) ， 和 甲壳 
纲 的 水 潘 Daphnia pulex (71 个 P450) 相 接近 ( 张 云 
华 等 , 2009 ) 。 在 更 豆 蚜 基因 组 中 ，P450 基因 数量 
最 多 的 家 族 是 CYP6 和 CYPA, 这 与 黑 腹 采 晶 和 内 
比 亚 按 蚊 具 有 相似 的 结果 (http://p450. sophia. 
inra. fr/) ， 而 水 潘 CYP4, CYPIS 和 CYP3 家 族 基因 
数量 最 多 ( 张 云 华 等 , 2009 ) M P450 基因 家 族 的 
功能 看 , 昆虫 CYP4 和 CYP6 家 族 的 一 些 成 员 具 有 
解毒 功能 , 在 杀 虫 剂 的 代谢 和 抗 性 方面 起 着 较为 重 
要 的 作用 (Berenbaum ，2002 ; Feyereisen, 2005) , ， 如 
Riy CYP6A2 和 CYP6G1 涉及 DDT pitt, 抗 DDT 
按 蚊 体 内 CYPAC27 基因 过 表达 (David et al., 


2005 ) 。 为 了 探测 青豆 是 中 预测 P450s 基因 的 真实 
性 , 我 们 将 这 些 候选 基因 与 吏 豆 蚜 ESTs 进行 了 比 
对 分 析 , 结果 显示 其 中 39 个 候选 基因 有 EST 同 源 
Hk, 与 其 他 30 个 候选 基因 相 比 表明 它们 更 可 能 为 
真实 的 P450 基因 。 

RE AEH AG E; ^H 2s 25 (A A 25 By 
MHC) 植物 NBS-LRR 和 哺乳 动物 的 PASO 基因 中 
普遍 存在 正 选 择 作 用 (Hammond-Kosack and Jones, 
1997; Dangl and Jones, 2001; ££, 2007), d 
因 家 族 的 正 选 择 作用 可 以 通过 对 基因 核 苷 酸 的 同 义 
突变 和 非 同 义 突 变 比值 进 行 推 新 。 我 们 使 用 PAML 
程序 对 P450 基因 家 族 47 条 序列 进行 正 选 择 分 析 ， 
AU LB xi EPA 9 条 PASO 基因 序列 受到 正 选 择 , 其 
中 受 正 选择 概率 大 于 9596 的 氨基 酸 位 点 分 别 是 20T 
和 27N, 其 中 20T 位 于 底 物 识别 位 点 SRS1, 27N 位 
于 D-helix, 该 区 域 具有 底 物 区 域 选 择 性 功能 ( Lewis 
et al., 1999) , Goldstone 和 Stegeman(2006 ) 在 人 研究 
CYP1A 亚 家 族 基 因 演 化 关系 时 , 发 现 人 、 小 鼠 和 鸡 
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的 CYP1A 亚 家 族 基因 的 底 物 识别 位 点 SRS3、SRS4 
或 酶 催化 重要 的 螺旋 I 区 域 存在 正 选 择 现象 。 在 对 
11 种 哺乳 动物 P450 2C 基因 研究 时 , 发 现 底 物 识 别 
位 点 SRSI, SRS3, SRS4 和 SRS6 也 存在 正 选 择 现 
Z (da Fonseca et al., 2007)。 由 此 表明 ,P450 基因 
受到 环境 压力 产生 正 选 择 作用 , 而 且 底 物 识别 位 点 
作为 正 选 择 位 点 的 现象 可 能 普遍 存在 于 多 种 生物 
中 , 通过 这 种 选择 作用 有 利于 来 拓宽 和 改变 P450 
对 底 物 的 专 化 性 , 提高 吏 豆 蚜 面 对 环境 中 多 样 的 内 
源 和 外 源 化 合 物 的 适应 性 。 

基因 转换 能 使 相似 的 基因 序列 间 遗 传 信息 产生 
不 等 价 的 交换 ， 即 可 使 序列 间 均 一 化 , 也 可 产生 点 
突变 , 因而 对 多 基因 家 族 的 进化 起 着 十 分 重要 的 作 
用 (Hammond-Kosack and Jones, 1997) , 一些 研 究 
认为 细胞 色素 P450 都 起 源 于 较 古 老 的 P450 基因 ， 
然后 通过 基因 复制 和 基因 转换 等 机 制 逐渐 形成 今天 
较为 功能 多 样 性 的 P450 超 基因 家 族 。 基 因 转 换 有 
助 于 P450 基因 从 其 他 相关 远 源 基因 或 假 基因 获得 
DNA 序列 片段 而 产生 一 些 新 功能 基因 (Atchison and 
Adesnik, 1986) , 这 有 助 于 昆虫 适应 多 变 复杂 的 外 
界 环境 。 理 豆 蚜 P450 基因 家 族 8 个 基因 组 中 , 有 3 
个 组 (包含 19 个 基因 , 占 全 基因 组 的 11.6% ) 检测 
出 了 统计 上 具有 显著 意义 的 基因 转换 事件 。 参 与 基 
因 转换 的 基因 成 员 之 间 的 重 日 相似 度 在 70% ~ 
95% 之 间 , 有 日 XM_001944991 5j XM. 001951794 [n] 
存在 于 SCAFFOLD12542 E, XM. 001945510 Ej XM 
001944057 同 存在 于 SCAFFOLD7010 E, ix Xe HH, 
上 述 基 因 可 能 通过 基因 复制 而 形成 的 。 基 因 复 制 和 
基因 转换 被 认为 是 PASO 基因 家 族 进 化 的 两 个 重要 
Æ (Atchison and Adesnik, 1986; Lewis et al., 
1998)。 因 此 更 豆 蚜 相 关 P450 基因 可 能 通过 基因 
复制 ,然后 通过 基因 转换 使 P450 获得 新 的 功能 ， 
以 适应 多 变 的 生存 环境 。 

利用 MEME 程序 对 P450 和 蛋白 序列 进行 基 序 分 
析 , TES xU] 69 个 P450 基因 序列 中 鉴定 出 20 个 
不 同 的 基 序 ,其 中 有 motif 1 ( heme-binding 基 序 ) 、 
motif 2 ( helix-I 基 序 ) , motif 3 ( PERF 基 序 ) motif 4 
(EXXR 基 序 ) „motif 11( PKG 基 序 ) 等 5 条 相对 比较 
保守 的 基 序 在 90% VI E BS S x Sp PASO 基因 中 出 
现 。motif 1 含有 一 个 保守 序列 FXXGXRXCXG, 其 
中 的 半 胱 氮 酸 残 基 是 血红 素 结合 (heme-binding ) 的 
配 体 (Feyereisen ，1999 ) , Motif 2 的 一 个 特征 序列 
ACA, G)XCE, D)T, 其 中 是 分 子 氧 结 合 位 点 的 
部 分 , 起 加 氧 作 用 ,其 位 置 为 I-helix ( Deng et al., 


2007) , Motif 2 的 特征 序列 对 于 诸如 两 二 烯 氧化 合 
成 酶 (CYP74) 一 类 使 用 过 氧化 物 为 底 物 的 P450 酶 
并 不 保守 ,因为 它们 并 不 需要 结合 氧 分 子 。 因 此 ， 
CYP74 在 进化 树 上 是 进化 距离 最 远 的 一 校 。 但 这 
并 不 能 反映 CYP74 进化 史 , 因为 该 区 域 对 于 其 并 
非 保守 区 域 (Nelgon，2006 ) 。motif 3 ( PERF 基 序 ) 
序列 为 PERF， 其 也 存在 一 些 变 体 ， 如 PSRF, 
PDNF, PORW 4&, EXXR ( motif 4) Æ P450 Æ HKS 
折合 中 起 着 至 关 重 要 的 作用 , 存在 于 P450s 较为 保 
守 的 区 域 K-helix ( Chen. and Zhou, 1992), 但 
Rupasinghe 等 (2006 ) 发 现 CYP157 没有 EXXR 3X 
序 , 为 什么 CYP157 在 进化 上 淘汰 EXXR 目前 仍 不 
清楚 。 

P450 是 参与 内 源 性 物质 和 外 源 性 化 合 物 代 谢 
的 重要 酶 。 我 们 对 更 豆 蚜 PASO 的 基因 家 族 、 基 因 转 
换 和 正 选 择 以 及 基 序 的 分 析 , 显示 了 塌 豆 蚜 基 因 组 
中 P450 基因 具有 和 较 高 的 多 样 性 ,其 中 部 分 基因 经 
历 了 基因 转换 和 受到 显著 的 正 选择 压力 作用 , 正 选 
择 位 点 位 于 底 物 识别 位 点 。 此 外 ，P450 基因 存在 
着 相对 保守 的 基 序 。 研 究 PASO 基因 家 族 这 些 特征 
为 进一步 阐述 昆虫 P450 对 内 源 性 与 外 源 性 化 合 物 
的 代谢 机 理 和 P450 功能 的 多 样 性 和 进化 规律 提供 
了 有 价值 的 参考 依据 。 
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